2001 年, 接受了天体物理学家教育的威斯利・科利博士, 撰写了 一篇关于他对体育队伍进行排名的新方法的论文。他的这一副产品大获成功, 以至于如同梅西的模型一样, 它现在也被纳人了BCS 对 NCAA 大学美式橄榄球队进行排名的方法之中。这个我们称为科利评分法的方法, 是对一个最简单而且最古老的评分体系的改进, 这个评分体系所用的便是获胜率。根据获胜率为队伍 $i$ 打出的评分值 $r_i$ 为 $$ r_i=\frac{w_i}{t_i}, $$ Wesley Colley 式中, $w_i$ 和 $t_i$ 分别为队伍 $i$ 所贏得的比赛场数和所进行的比赛总场数。在世界范围内的 种娱乐性联赛和巡回赛中, 胜率法都是主要的评分方法。实际上, 它也为大多数职业联赛 所使用。尽管简单而且易于使用, 但这一评分体系确实有着几个明显的缺陷。首先,在类 似橄榄球这样的体育项目中, 大多数队伍都会与同一批对手交锋相同数量的场次, 因此常 常会发生评分持平的情况; 其次, 分析中并末以任何方式对对手的强弱加以考虑, 因此相 比于击败联盟中最强的队伍, 击败联盟中最弱的队伍也能够在评分中带来同样的好处, 而这可以说是不公平的; 再次, 有时胜率评分会给出不太正常的结果, 例如, 在赛季开始 时, 所有队伍的赛季前评分都是 $\frac{0}{0}$ ,此外,随着赛季的推进,一场末胜的队伍所得的评 分将为 0 。威斯利 - 科利提出了一个我们称为科利法的体育队伍评分方法, 以求能够弥补某些缺陷。

科利法的主要思想

科利法源自对传统胜率公式的一个小小的修改 $$ r_i=\frac{1+w_i}{2+t_i} $$ 在本节中我们将说明, 这一修改的主要优点在于它考虑了赛程强度, 即一支队伍的对手强弱。

科利对胜率公式的调整, 其思路源于确定骰桌下注的拉普拉斯的 “承续法则” ( rule of succession)。尽管对于传统胜率公式进行的这一修改看来变动不大, 但相比于传统的公式而言, 它却具有了若干优点。相比于无意义的 $\frac{0}{0}$ 的赛季前评分, 现在每支队伍在赛 季开始时都以相同的评分 $\frac{1}{2}$ 开始。此外, 如果队伍 $i$ 在赛季的第一周输给了对手, 则科利评分将给出 $r_i=\frac{1}{3}$, 他认为这一数值比 $r_i=0$ 更为合理。 使用拉普拉斯法则, 即式而非标准胜率的另一个优点, 与所谓赛程强度的概念有关。我们的想法是, 相比于击败较弱的对手而言, 一支队伍应能从战胜强队中获得更 多的奖励。实际上, 队伍 $i$ 的评分应该与其对手的评分相关联。科利认为, 拉普拉斯的法 则一一尽管是隐含地一一但却包含了队伍 $i$ 的赛程强度。注意到在式中, 所有队伍都从 $r_i=1 / 2$ 开始, 而随着赛季的推进, 各队的评分将或高或低地偏离这一起始评分。 实际上, 一支队伍(以比赛获胜的形式)所得的好处, 就是另一支队伍的损失, 因此这些评分之间是相互依赖的。这样的相互依赖性在式中并不明显, 而只能通过仔细地剖析才能加以揭示。首先, 我们将一支队伍获胜的场数加以分解。 $$ \begin{aligned} w_i &=\frac{w_i-l_i}{2}+\frac{w_i+l_i}{2} \\ &=\frac{w_i-l_i}{2}+\frac{t_i}{2} \\ &=\frac{w_i-l_i}{2}+\sum_{j=1}^{t_i} \frac{1}{2} \circ \end{aligned} $$

由于所有的队伍在赛季初都从 $r_j=1 / 2$ 这个评分开始, 因此总和 $\sum_{j=1}^{t_i} \frac{1}{2}$ 在初始时等于 $\sum_{j \in 0_i} r_j$, 其中, $O_i$ 为队伍 $i$ 的对手集合。随着赛季的展开, 和式 $\sum_{j=1}^{t_i} \frac{1}{2}$ 便有可能不等于 $\sum_{j \in 0_i} r_j$, 不过它 可以通过对手的累积评分来很好地加以近似 (记住评分总是在 $1 / 2$ 附近摇摆)。因此, $$ w_i \approx \frac{w_i-l_i}{2}+\sum_{j \in 0_i} r_{j \circ} $$ 假设上式为等式, 并代人式 $(3.1)$, 则可得 $$ r_i=\frac{1+\left(w_i-l_i\right) / 2+\sum_{j \in 0_i} r_i}{2+t_i} \text { 。 } $$ 当然, 正如之前的评分体系一样, 我们的目标是找出这些末知的 $r_i$ 。上式表明, 在这种情况下, 未知的 $r_i$ 依赖于其他末知数, 即 $r_j$ 。这也说明了科利法是如何将对手的强弱结合到队伍的评分之中的。通过更多一些代数运算, 并利用矩阵的表示方法, 我们发现 $r_i$ 对其余 $r_j$ 的依赖性并不是个问题。 $r_i$ 可以被容易地求出。实际上, 式可以被 很紧凑地写为一个线性系统 $C r=b$, 其中, $r_{n \times 1}$ 是未知的科利评分向量, $b_{n \times 1}$ 是右向量, 定义为 $b_i=1+\frac{1}{2}\left(w_i-l_i\right)$, 而 $C_{n \times n}$ 是科利系数矩阵, 定义为

$$ C_{i j}=\left\{\begin{array}{l} 2+t_i, i=j, \\ -n_{i j}, i \neq j, \end{array}\right. $$

式中, $n_{i j}$ 为队伍 $i$ 和 $j$ 的交手次数。可以证明, 科利系统 $\boldsymbol{C r}=\boldsymbol{b}$ 总是具有唯一解, 因为 $C_{n \times n}$ 是可逆的。

范例

现在是时候在那个使用表数据的小型示例上来测试一下科利法了。 此时的科利线性系统 $\boldsymbol{C r}=\boldsymbol{b}$ 如下。 $$ \left(\begin{array}{ccccc} 6 & -1 & -1 & -1 & -1 \\ -1 & 6 & -1 & -1 & -1 \\ -1 & -1 & 6 & -1 & -1 \\ -1 & -1 & -1 & 6 & -1 \\ -1 & -1 & -1 & -1 & 6 \end{array}\right)\left(\begin{array}{c} r_1 \\ r_2 \\ r_3 \\ r_4 \\ r_5 \end{array}\right)=\left(\begin{array}{c} -1 \\ 3 \\ 1 \\ 0 \\ 2 \end{array}\right) . $$

注意 $\boldsymbol{C}$ 是一个实对称正定阵。这些性质意味着 $\boldsymbol{C}$ 具有形如 $\boldsymbol{C}=\boldsymbol{U}^{\mathrm{T}} \boldsymbol{U}$ 的乔列斯基分解(又称平方根法, Cholesky decomposition) ${ }^{[54]}$, 其中, $\boldsymbol{U}$ 是一个上三角阵。因此, 如果得到了乔列斯基分解, 就能非常高效地求解科利系统 $\boldsymbol{C r}=\boldsymbol{b}$ 。但是, 对于许多体育领域的应用而言, 这一系统的规模都较小, 从而足以使软件包, 按标准的数值 计算方法如高斯消元法、克雷洛夫法(Krylov methods)等, 可以迅速计算评分向量 $\boldsymbol{r}$ 。将 科利评分法用于我们的范例, 可得如下表所示的评分以及排名。

科利评分法总结

$$\boldsymbol{C}_{i j}=\left\{\begin{array}{l} 2+t_i, i=j, \\ -n_{i j}, i \neq j \end{array}\right. $$

科利算法就是求解系统 $\boldsymbol{C r}=\boldsymbol{b}$ 以获取科利评分向量 $\boldsymbol{r}$ 。

资料来源